С прискорбием сообщаю, что на
https://huggingface.co/ найти качественную квантизацию любой модели в формат GGUF практически невозможно.
Как говорится, хочешь сделать хорошо - сделай сам.
Итак, есть гид по командам HuggingFace, благодаря которым можно скачать нужные модели в исходниках, а затем провести квантизацию в нужный формат.
(
Read more... )